智能论文笔记

pyGSL: A Graph Structure Learning Toolkit

Max Wasserman , Gonzalo Mateos

分类：机器学习

2022-11-07

We introduce pyGSL, a Python library that provides efficient implementations of state-of-the-art graph structure learning models along with diverse datasets to evaluate them on. The implementations are written in GPU-friendly ways, allowing one to scale to much larger network tasks. A common interface is introduced for algorithm unrolling methods, unifying implementations of recent state-of-the-art techniques and allowing new methods to be quickly developed by avoiding the need to rebuild the underlying unrolling infrastructure. Implementations of differentiable graph structure learning models are written in PyTorch, allowing us to leverage the rich software ecosystem that exists e.g., around logging, hyperparameter search, and GPU-communication. This also makes it easy to incorporate these models as components in larger gradient based learning systems where differentiable estimates of graph structure may be useful, e.g. in latent graph learning. Diverse datasets and performance metrics allow consistent comparisons across models in this fast growing field. The full code repository can be found on https://github.com/maxwass/pyGSL.

translated by 谷歌翻译

Learning to Model the Relationship Between Brain Structural and Functional Connectomes

Yang Li , Gonzalo Mateos , Zhengwu Zhang

分类：机器学习

2021-12-18

Neuroomaging的最新进展以及网络数据统计学习中的算法创新提供了一种独特的途径，可以集成大脑结构和功能，从而有助于揭示系统水平的一些大脑组织原则。在此方向上，我们通过曲线图编码器 - 解码器系统制定了一种模拟脑结构连接（SC）和功能连接（FC）之间的关系的监督图形表示学习框架，其中SC用作预测经验FC的输入。训练图卷积编码器捕获模拟实际神经通信的大脑区域之间的直接和间接相互作用，以及集成结构网络拓扑和节点（即，区域特定的）属性的信息。编码器学习节点级SC嵌入，它们组合以生成用于重建经验FC网络的（全大脑）图级表示。所提出的端到端模型利用多目标损失函数来共同重建FC网络，并学习用于下游主题的SC-To-Fc映射的判别图表表示（即，图形级）分类。综合实验表明，所述关系的学习表现从受试者的脑网络的内在属性中捕获有价值的信息，并导致提高对来自人类连接项目的大量重型饮酒者和非饮酒者的准确性提高。我们的工作提供了关于脑网络之间关系的新见解，支持使用图形表示学习的有希望的前景，了解有关人脑活动和功能的更多信息。

translated by 谷歌翻译

Best Axes Composition Extended: Multiple Gyroscopes and Accelerometers Data Fusion to Reduce Systematic Error

Marsel Faizullin , Gonzalo Ferrer

分类：机器人

2022-09-19

与单个IMU相比，多个刚性连接的惯性测量单元（IMU）传感器提供了更丰富的数据流。最先进的方法遵循IMU测量的概率模型，基于在贝叶斯框架下组合的错误的随机性质。但是，负担得起的低级IMU此外，由于其不受相应的概率模型所掩盖的缺陷而遭受了系统的错误。在本文中，我们提出了一种方法，即合并多个IMU（MIMU）传感器数据的最佳轴组成（BAC），以进行准确的3D置置估计，该数据通过从集合中动态选择最佳的IMU轴来考虑随机和系统误差所有可用的轴。我们在MIMU视觉惯性传感器上评估了我们的方法，并将方法的性能与MIMU数据融合的最新方法进行比较。我们表明，BAC的表现优于后者，并且在开放环路中的方向和位置估计都可以提高20％的精度，但需要适当的处理以保持获得的增益。

translated by 谷歌翻译

Multi-objective hyperparameter optimization with performance uncertainty

Alejandro Morales-Hernández , Inneke Van Nieuwenhuyse , Gonzalo Nápoles

分类：机器学习 | 人工智能

2022-09-09

任何机器学习（ML）算法的性能受到其超参数的选择影响。由于培训和评估ML算法通常很昂贵，因此需要在实践中有效地计算高参数优化（HPO）方法。多数目标HPO的大多数现有方法都使用进化策略和基于元模型的优化。但是，很少有方法可以解释性能测量中的不确定性。本文提出了多目标超参数优化的结果，并在评估ML算法的情况下进行了不确定性。我们将树结构化parzen估计量（TPE）的采样策略与训练高斯过程回归（GPR）在异质噪声后获得的元模型相结合。关于三个分析测试功能和三个ML问题的实验结果表明，相对于超量指标，多目标TPE和GPR的改善。

translated by 谷歌翻译

T4DT: Tensorizing Time for Learning Temporal 3D Visual Data

Mikhail Usvyatsov , Rafael Ballester-Rippoll , Lina Bashaeva , Konrad Schindler , Gonzalo Ferrer , Ivan Oseledets

分类：计算机视觉

2022-08-02

与2D栅格图像不同，没有用于3D视觉数据处理的单个主导表示。点云，网格或隐式功能等不同格式都具有其优点和劣势。尽管如此，诸如签名距离函数之类的网格表示在3D中也具有吸引人的属性。特别是，它们提供恒定的随机访问，并且非常适合现代机器学习。不幸的是，网格的存储大小随其尺寸而呈指数增长。因此，即使在中等分辨率下，它们也经常超过内存限制。这项工作探讨了各种低量张量格式，包括Tucker，Tensor Train和Wartenics Tensor tensor tensor tensor tensor分解，以压缩时间变化的3D数据。我们的方法迭代地计算，体素化和压缩每个帧的截断符号距离函数，并将张量式截断施加到代表整个4D场景的单个压缩张量中，将所有框架凝结到一个单个压缩张量中。我们表明，低级张量压缩对于存储和查询时间变化的签名距离功能非常紧凑。它大大降低了4D场景的内存足迹，同时令人惊讶地保留了它们的几何质量。与现有的基于迭代学习的方法（如DEEPSDF和NERF）不同，我们的方法使用具有理论保证的封闭式算法。

translated by 谷歌翻译

TweetNLP: Cutting-Edge Natural Language Processing for Social Media

Jose Camacho-Collados , Kiamehr Rezaee , Talayeh Riahi , Asahi Ushio , Daniel Loureiro , Dimosthenis Antypas , Joanne Boisson , Luis Espinosa-Anke , Fangyu Liu , Eugenio Martínez-Cámara

分类：自然语言处理

2022-06-29

在本文中，我们介绍了TweetNLP，这是社交媒体中自然语言处理（NLP）的集成平台。TweetNLP支持一套多样化的NLP任务，包括诸如情感分析和命名实体识别的通用重点领域，以及社交媒体特定的任务，例如表情符号预测和进攻性语言识别。特定于任务的系统由专门用于社交媒体文本的合理大小的基于变压器的语言模型（尤其是Twitter）提供动力，无需专用硬件或云服务即可运行。TweetNLP的主要贡献是：（1）使用适合社会领域的各种特定于任务的模型，用于支持社交媒体分析的现代工具包的集成python库；（2）使用我们的模型进行无编码实验的交互式在线演示；（3）涵盖各种典型社交媒体应用的教程。

translated by 谷歌翻译

Conditioned Human Trajectory Prediction using Iterative Attention Blocks

Aleksey Postnikov , Aleksander Gamayunov , Gonzalo Ferrer

分类：机器人 | 人工智能

2022-06-29

人类运动预测是了解社会环境，在机器人技术，监视等中直接应用的关键。我们提出了一个简单而有效的行人轨迹预测模型，该模型旨在旨在行人在以环境为条件的城市风格环境中进行预测：地图和环绕剂。我们的模型是一种基于神经的架构，可以以迭代顺序方式运行几层注意力块和变压器，从而捕获环境中的重要特征以改善预测。我们表明，如果不明确引入社交面具，动态模型，社交池层或复杂的图形结构，则可以使用SOTA模型在PAR结果上产生，这使我们的方法易于扩展和配置，取决于可用的数据。我们报告与SOTA模型相似的结果，该模型在具有单峰预测指标和FDE的公开可用和可扩展的数据集上。

translated by 谷歌翻译

A Fast Alternating Minimization Algorithm for Coded Aperture Snapshot Spectral Imaging Based on Sparsity and Deep Image Priors

Qile Zhao , Xianhong Zhao , Xu Ma , Xudong Chen , Gonzalo R. Arce

分类：计算机视觉

2022-06-12

编码的光圈快照光谱成像（CASSI）是一种用于从一个或几个二维投影测量值重建三维高光谱图像（HSI）的技术。但是，较少的投影测量或更多的光谱通道导致了严重的问题，在这种情况下，必须应用正则化方法。为了显着提高重建的准确性，本文提出了一种基于自然图像的稀疏性和深层图像先验（FAMA-SDIP）的快速交流最小化算法。通过将深层图像（DIP）集成到压缩感应（CS）重建原理中，提出的算法可以在没有任何培训数据集的情况下实现最新结果。广泛的实验表明，FAMA-SDIP方法显着优于模拟和实际HSI数据集的主要主要方法。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Hardware-accelerated Mars Sample Localization via deep transfer learning from photorealistic simulations

Raúl Castilla-Arquillo , Carlos Jesús Pérez-del-Pulgar , Gonzalo Jesús Paz-Delgado , Levin Gerdes

分类：计算机视觉 | 人工智能 | 机器学习 | 机器人

2022-06-06

The goal of the Mars Sample Return campaign is to collect soil samples from the surface of Mars and return them to Earth for further study. The samples will be acquired and stored in metal tubes by the Perseverance rover and deposited on the Martian surface. As part of this campaign, it is expected that the Sample Fetch Rover will be in charge of localizing and gathering up to 35 sample tubes over 150 Martian sols. Autonomous capabilities are critical for the success of the overall campaign and for the Sample Fetch Rover in particular. This work proposes a novel system architecture for the autonomous detection and pose estimation of the sample tubes. For the detection stage, a Deep Neural Network and transfer learning from a synthetic dataset are proposed. The dataset is created from photorealistic 3D simulations of Martian scenarios. Additionally, the sample tubes poses are estimated using Computer Vision techniques such as contour detection and line fitting on the detected area. Finally, laboratory tests of the Sample Localization procedure are performed using the ExoMars Testing Rover on a Mars-like testbed. These tests validate the proposed approach in different hardware architectures, providing promising results related to the sample detection and pose estimation.

translated by 谷歌翻译